Med-Gemini: Google arbeitet an multimodalen KI-Modellen für den Medizinbereich

Google will mit seinem multimodalen Sprachmodell "Med-Gemini" den Gesundheitsbereich und auch die biomedizinische Forschung voranbringen.

In Pocket speichern vorlesen Druckansicht 6 Kommentare lesen
Arzt mit Stethoskop in der Hand

(Bild: PopTika/Shutterstock.com)

Lesezeit: 2 Min.

Google will mit Gemini auch den Gesundheitsbereich und auch die biomedizinische Forschung voranbringen und stellt Med-Gemini vor, eine speziell auf das Gesundheitswesen trainierte Version von Gemini mit integrierter Websuche. Dabei fließen die Sprach- und Konversationsfähigkeiten von Gemini ein. Verbessert habe Google das unter anderem durch ein Selbsttraining mittels Websuche.

Für jede Frage generiert Med-Gemini-L 1.0 Suchanfragen, deren Antworten medizinische Fragen beantworten könnten. Anschließend werden die Suchanfragen an eine "web search API" übergeben. Die abgerufenen Ergebnisse werden in die Eingabeaufforderung von Med-Gemini-L 1.0 für die nächste Iteration integriert. Dadurch soll sich die Suche verfeinern lassen.

Google will Med-Gemini mithilfe von Selbsttraining und Integration der Websuche verbessert haben.

(Bild: Saab et al.)

Wie auch Meta und weitere Anbieter haben die Entwicklerinnen und Entwickler zum Ziel, mit generativen KI-Modellen Ärzte zu entlasten – beispielsweise bei der Analyse computertomografischer Bilder. Ärzte sollen dabei Fragen zu einem Bild, aber auch welche zu Videos stellen können. Dabei sucht das Kontext-stärkere Med-Gemini-M 1.5 den relevanten Videoabschnitt heraus.

Neben Studien nutzt Google auch weitere im medizinischen Alltag anfallende Daten, etwa klinische Notizen, elektronische Gesundheitsakten und auch Daten von Fitbit können zum Einsatz kommen. Die meisten verwendeten Datensätze sind Open Source oder öffentlich zugänglich. Geplant ist, die medizinischen Modelle über Googles Cloud APIs verfügbar zu machen. Google Research und Google DeepMind arbeiten dafür gemeinsam mit Ärzten an der Verbesserung der KI-Systeme, heißt es in dem Paper.

Laut Google übertrifft Med-Gemini bisherige Sprachmodelle im Medizinbereich – mit MedPalm auch sich selbst. Beim MedQA-Benchmark (USMLE) erreiche Googles leistungsstärkstes Med-Gemini-Modell (Med-Gemini-M 1.5) eine Leistung von 91,1 Prozent Genauigkeit. Das geht aus einer Studie hervor, die unter anderem in Zusammenarbeit mit Forschern DeepMind und Google Cloud entstanden ist.

Med-Gemini soll besser sein als alle bisherigen kommerziellen KI-Modelle im Medizinbereich.

(Bild: Saab et al.)

Weitere Forschung ist Google zufolge in diesem sensiblen Bereich jedoch erforderlich, um die Genauigkeit und Relevanz der Suchergebnisse sowie die Qualität der Antworten zu analysieren und die Nutzung von Web-Suche auch für kleinere KI-Modelle zu ermöglichen.

Das 2014 von Google gekaufte Start-up DeepMind stellte erst kürzlich AlphaFold 3 vor, eine verbesserte Version seines Proteinmodellierungssystems zur Vorhersage von Proteinstrukturen.

(mack)